python pack_eodvec.py \
  --mindrecord_schema internlm2_alpaca \
  --input_glob /data/version/MS24_1022/data/merged_data_internlm2.json \
  --output_file /data/version/MS24_1022/data/pack_eodvec/merged_data_internlm2_eodvecpacked_32k.mindrecord \
  --model_file tokenizer.model \
  --seq_length 32768